년 9월 AI 및 로봇 연구 동향

년 9월 AI 및 로봇 연구 동향

1. 서론

2021년 9월은 인공지능(AI) 및 로봇 공학 분야가 단순한 알고리즘의 성능 향상을 넘어, 국가적 차원의 전략 수립, 산업 생태계의 구조적 재편, 그리고 기술의 사회적 책임에 대한 근본적인 논의가 본격화되는 중요한 변곡점으로 기록된다. 이 시기는 거대 언어 모델(Large Language Models)의 상업적 잠재력이 가시화되고 1, 로봇 기술이 농업, 의료 등 현실 세계의 복잡한 문제 해결에 깊숙이 관여하기 시작한 분기점이었다.2 학계에서는 이론적 탐구를 넘어 기술의 강건성(robustness), 안전성(safety), 그리고 인간과의 상호작용(human-robot interaction)에 대한 심도 있는 연구 결과들이 집중적으로 발표되었다.

본 보고서는 2021년 9월 한 달 동안 발표된 AI 및 로봇 공학 분야의 주요 동향을 네 가지 핵심 축으로 나누어 심층적으로 분석하고자 한다. 첫째, 국가 및 산업계 전략에서는 영국 정부의 국가 AI 전략 발표와 국내외 기업들의 전략적 제휴를 통해 AI 기술이 어떻게 국가 경쟁력과 산업 패권의 핵심 요소로 자리 잡게 되었는지를 조망한다. 둘째, 주요 학술대회 동향에서는 당대 최고의 지성들이 모여 최신 연구 성과를 공유한 IROS 2021을 비롯한 주요 학술 행사를 통해 연구 커뮤니티의 핵심 관심사를 파악한다. 셋째, IROS 2021 수상 논문 심층 분석에서는 해당 학회에서 가장 주목받은 연구들을 기술적으로 분석하여 당시 로봇 공학 연구의 최전선(state-of-the-art)을 가늠한다. 마지막으로, arXiv 신규 핵심 연구에서는 공식 학술 절차를 거치기 전 공개된 선도적인 연구들을 통해 미래 기술 발전의 방향성을 예측한다. 본 보고서는 개별 사건의 단순한 나열을 지양하고, 각 동향 간의 유기적 관계와 그 이면에 담긴 기술적, 사회적 함의를 도출하는 데 중점을 둔다.

2. 국가 및 산업계 주요 동향: AI 패권 경쟁과 전략적 재편

2021년 9월, AI 기술은 연구실의 성과를 넘어 국가의 미래와 기업의 생존을 결정짓는 핵심 전략 자산으로 그 위상이 격상되었다. 영국은 국가적 비전을 제시하며 AI 산업 육성에 대한 강력한 의지를 표명했고, 산업계에서는 기술력과 자본력의 결합을 통한 새로운 경쟁 구도가 형성되었다. 이는 AI 기술 개발이 더 이상 개별 주체의 역량만으로는 한계가 있으며, 국가적 지원과 거대 자본의 투입이 필수적인 단계로 진입했음을 시사한다.

2.1 영국의 국가 AI 전략: 브렉시트 이후의 기술 주도 성장 계획

2021년 9월, 영국 정부는 브렉시트(Brexit) 이후 직면한 경제적 불확실성을 극복하고 미래 성장 동력을 확보하기 위한 핵심 방안으로 범정부 차원의 ’국가 AI 전략(National AI Strategy)’을 발표했다.4 이 전략은 AI를 단순한 신기술이 아닌, 국가 경제와 안보의 근간을 이루는 핵심축으로 규정하고, 향후 10년간의 장기적인 생태계 조성과 글로벌 리더십 확보를 목표로 수립되었다.

이 전략의 발표는 AI 기술의 패권이 곧 국가 경쟁력을 좌우하는 시대가 도래했음을 공식화한 중요한 사건이다. 특히 영국이 브렉시트라는 지정학적, 경제적 격변 속에서 AI를 국가적 돌파구로 삼았다는 점은 주목할 만하다. 이는 AI 기술 주권을 확보하려는 국가들의 노력이 향후 더욱 치열해질 것임을 예고하며, 다른 국가들의 AI 정책 수립 방향에도 중요한 선례를 남겼다. AI 기술 개발과 활용을 위한 인재 양성, 연구 개발 투자 확대, 데이터 접근성 강화, 그리고 윤리적 가이드라인 수립 등 포괄적인 내용을 담은 이 전략은 AI가 사회 전반에 미치는 영향을 종합적으로 고려한 결과물이라 할 수 있다.

2.2 국내 기술 동향: 글로벌 AI 패권 경쟁과 원천 기술 확보

국내에서도 글로벌 AI 패권 경쟁에 대응하기 위한 기술력 확보와 전략적 움직임이 활발하게 나타났다. 특히 거대 언어 모델과 같은 원천 기술을 중심으로 산업 생태계가 재편되는 양상이 뚜렷했으며, 기초 과학 분야에서도 AI를 활용한 혁신적인 연구 성과가 도출되었다.

2.2.1 네이버-두나무 연합의 전략적 함의 분석

2021년 9월을 기점으로 네이버와 두나무 간의 전략적 제휴가 업계의 주요 화두로 떠올랐다. 네이버는 2021년, 막대한 R&D 투자를 통해 개발한 한국어 특화 거대 언어 모델 ’하이퍼클로바’를 성공적으로 공개하며 세계적 수준의 AI 원천 기술을 확보했음을 입증했다.1 반면, 가상자산 거래소 업비트를 운영하는 두나무는 막대한 영업이익을 바탕으로 강력한 현금 창출력을 보유하고 있었다. 이 두 기업의 결합은 ’글로벌 AI 패권 경쟁’이라는 거대한 흐름 속에서 네이버의 독보적인 AI 기술력과 두나무의 막강한 자금력이 결합하는 시너지 효과를 창출하기 위한 전략적 포석으로 분석된다.1

이러한 움직임은 AI 기술 개발, 특히 파운데이션 모델 분야가 천문학적인 비용을 요구하는 ‘쩐의 전쟁’ 양상으로 변화하고 있음을 보여주는 상징적인 사례이다. 대규모 GPU 클러스터 구축, 고품질 데이터셋 확보 및 정제, 그리고 세계 최고 수준의 연구 인력 유치 등은 지속 가능한 거대 자본의 뒷받침 없이는 불가능하다. 따라서 원천 기술을 보유한 빅테크 기업과 자금력을 갖춘 신흥 강자의 결합은 향후 AI 산업 생태계에서 나타날 새로운 합종연횡의 모델을 제시하며, 후발 주자들에게는 넘기 어려운 높은 진입 장벽으로 작용할 것임을 시사한다.

2.2.2 한국표준과학연구원(KRISS)의 3차원 재구성 알고리즘 개발

같은 달 29일, 한국표준과학연구원(KRISS)은 주사전자현미경(SEM)으로 촬영한 2차원 평면 이미지를 3차원 입체 구조로 정밀하게 재구성하는 AI 기반 알고리즘을 개발했다고 발표했다.5 이 기술은 복잡하고 미세한 생물학적 시료의 구조를 왜곡 없이 입체적으로 분석할 수 있는 새로운 길을 열었다는 점에서 기초 과학 분야의 중요한 성과로 평가된다.

이 연구는 AI 기술이 단순히 상업적 응용 분야를 넘어, 현미경 이미지 분석과 같은 기초 과학 연구의 방법론 자체를 근본적으로 혁신할 수 있는 강력한 잠재력을 가지고 있음을 명확히 보여준다. 2차원 정보의 한계로 인해 파악하기 어려웠던 세포나 바이러스의 복잡한 상호작용을 3차원으로 시각화하고 정량적으로 분석할 수 있게 됨으로써, 생명 과학 및 재료 공학 등 다양한 분야의 연구를 가속화할 것으로 기대된다. 이는 AI 기술의 핵심적인 특성인 ’융합’과 ’확장’의 가치를 명확히 드러내는 사례이다.5

2.3 분야별 투자 동향: 중국 의료 로봇 시장의 부상

2021년 9월 기준, 중국의 의료용 로봇 산업에 대한 투자가 폭발적으로 증가하고 있었다. 해당 시점까지의 투자 동향을 분석한 결과, 전체 투자액 중 수술용 로봇에 대한 투자 비중이 81%로 압도적인 우위를 차지했으며, 재활 로봇(10%)과 기타 의료 서비스 로봇(9%)이 그 뒤를 이었다.3

이러한 집중적인 투자는 전 세계적인 고령화 추세와 최소 침습 수술 등 정밀 의료에 대한 수요 증가에 힘입어 의료 로봇 시장, 특히 높은 기술력과 부가가치를 지닌 수술 로봇 시장이 가파르게 성장하고 있음을 명확히 보여준다. 중국 자본이 수술 로봇 분야에 집중적으로 유입되는 현상은 단순히 시장 성장에 대한 기대를 넘어, 해당 분야의 기술 패권을 확보하려는 전략적 의도가 담겨 있는 것으로 해석될 수 있다. 이는 향후 글로벌 의료 로봇 시장의 기술 경쟁 구도와 시장 판도에 상당한 변화를 가져올 것임을 예고하는 중요한 신호탄이다.

3. 주요 학술대회 및 연구 발표 동향

2021년 9월은 전 세계 AI 및 로봇 공학 연구자들이 최신 지식을 교류하고 미래 연구 방향을 논의하는 중요한 학술의 장이 활발하게 열린 시기였다. 특히, 로봇 공학 분야에서 세계 최고 권위를 자랑하는 국제 학술대회인 IROS(International Conference on Intelligent Robots and Systems)가 개최되어 학계의 모든 이목이 집중되었다. 이와 더불어 스마트 시티, 로봇 지능 기술 등 특정 응용 분야에 초점을 맞춘 다양한 행사들이 연이어 개최되며 기술의 실용화와 사회적 적용에 대한 깊이 있는 논의가 이루어졌다.

아래 표는 2021년 9월에 개최된 주요 AI 및 로봇 관련 학술 행사를 요약한 것이다. 이 표는 당시 연구 커뮤니티의 주요 관심사가 무엇이었는지, 그리고 지리적으로 어떤 지역이 연구 활동의 중심지였는지를 한눈에 파악할 수 있게 해준다. 각 행사의 주제는 당시 학계의 연구 지형도를 이해하는 데 중요한 단서를 제공한다.

테이블 1: 2021년 9월 주요 AI 및 로봇 관련 학술 행사

학회/행사명개최 기간개최지주요 주제관련 자료
Second SciRoc Challenge2021.09.06-10이탈리아 볼로냐스마트 시티 로보틱스, 스마트 포용6
GSERITA 20212021.09.06-08가상 개최로봇 지능 기술 및 응용, 지능형 헬스케어7
World Robot Summit 20202021.09.09-12일본 아이치미래 로봇 기술, 로봇 챌린지7
IROS 20212021.09.27-10.01체코 프라하지능형 로봇 및 시스템 전반6
한국인공지능학회 추계학술대회(논문 마감: 9/10)온라인인공지능 전반9

3.1 IROS 2021: 지능형 로봇 및 시스템의 최신 연구 동향

3.1.1 학회 개요 및 주요 발표 세션 분석

IROS(IEEE/RSJ International Conference on Intelligent Robots and Systems)는 ICRA와 함께 로봇 공학 분야를 대표하는 양대 최고 수준의 학회로, 2021년 9월 27일부터 10월 1일까지 체코 프라하에서 개최되었다.6 이 해 학회에는 총 2,801편의 방대한 논문이 제출되었으며, 그중 45%가 채택되어 발표되었다.10 이는 해당 분야의 연구가 전 세계적으로 매우 활발하게 이루어지고 있으며, 연구자들 간의 경쟁 또한 치열함을 방증하는 수치이다. 학회 프로그램은 로봇 공학의 이론적 기초부터 실제 응용에 이르기까지 광범위한 주제를 포괄하며, 당시 로봇 기술의 현주소를 가늠할 수 있는 가장 중요한 바로미터 역할을 했다.

3.1.2 주목할 만한 연구 주제

IROS 2021에서 발표된 논문 목록을 심층적으로 분석한 결과, 몇 가지 핵심적인 연구 주제가 두드러지게 나타났다.8 가장 많은 연구가 집중된 분야는 ▲**심층 학습 기반 시각 인지(Deep Learning for Visual Perception)**로, 로봇이 주변 환경을 인간처럼 이해하고 해석하는 능력에 대한 연구가 주를 이루었다. 이와 밀접하게 연관된 ▲ 파지 및 조작(Grasping and Manipulation) 분야에서는 로봇이 다양한 형태와 재질의 물체를 정교하게 다루는 기술에 대한 연구가 활발히 진행되었다. 또한, ▲항공 시스템의 자율성(Aerial Systems: Perception and Autonomy) 세션에서는 드론과 같은 무인 항공기가 복잡하고 동적인 환경에서 스스로 판단하고 임무를 수행하는 기술이, ▲자율주행(Autonomous Vehicle Navigation) 세션에서는 차량이 도로 위 다양한 상황에 대처하며 안전하게 주행하는 기술이 주요 의제로 다루어졌다. 이러한 주제들은 공통적으로 로봇 기술이 통제된 실험실 환경을 벗어나 예측 불가능한 실제 환경에서의 자율성과 강건성(robustness)을 확보하는 방향으로 빠르게 발전하고 있음을 명확히 보여준다.

3.2 기타 주요 로보틱스 행사 및 챌린지

IROS와 같은 대규모 종합 학술대회 외에도, 특정 응용 분야에 초점을 맞춘 전문 행사들이 다수 개최되어 로봇 기술의 실용적 가치를 탐구하는 장을 마련했다.

3.2.1 SciRoc Challenge

이탈리아 볼로냐에서 개최된 SciRoc 챌린지는 ’스마트 포용(Smart Inclusion)’이라는 독특한 주제를 내걸었다.6 이 행사는 로봇이 도시 환경 속에서 노약자나 장애인과 같은 사회적 약자를 돕고, 모든 시민의 삶의 질을 향상시키는 데 어떻게 기여할 수 있는지를 실증적으로 탐구하는 실용적인 성격의 대회였다. 이는 로봇 기술 개발이 단순한 기술적 성취를 넘어 사회적 가치 창출이라는 목표를 지향해야 한다는 중요한 메시지를 전달했다.

3.2.2 GSERITA (Global Summit and Expo on Robot Intelligence Technology and Applications)

가상으로 개최된 GSERITA 2021은 로봇 지능 기술과 실제 산업 응용 사이의 간극을 줄이는 데 초점을 맞춘 행사였다.7 특히 지능형 헬스케어 시스템, 지식 공학, 빅데이터 분석 등 구체적인 응용 분야를 중심으로, 최신 AI 기술이 어떻게 로봇 시스템에 통합되어 실질적인 가치를 창출할 수 있는지에 대한 심도 있는 논의가 이루어졌다.

3.2.3 World Robot Summit

코로나19 팬데믹으로 인해 1년 연기되어 2021년 9월 일본 아이치에서 개최된 World Robot Summit 2020은 최신 로봇 기술을 한자리에서 볼 수 있는 전시회(World Robot Expo)와 세계 각국의 팀들이 기술력을 겨루는 경쟁(World Robot Challenge)으로 구성되었다.7 이 행사는 로봇 기술의 현재 수준을 점검하고, 미래 사회에서 로봇이 수행할 역할과 발전 방향을 대중과 함께 조망하는 중요한 기회를 제공했다.

이러한 다양한 학술 행사들은 로봇 연구의 패러다임이 중요한 전환점을 맞이하고 있음을 시사한다. IROS와 같은 전통적인 학술대회가 기술의 깊이를 더하는 역할을 한다면, SciRoc, GSERITA, World Robot Summit과 같은 응용 중심의 행사들은 기술의 사회적, 산업적 가치를 탐구하며 그 외연을 확장하고 있다. 이는 로봇 연구가 순수한 기술적 성취를 넘어, 실제 사회 문제를 해결하고 인간의 삶에 직접적인 혜택을 제공하는 방향으로 이동하고 있음을 보여준다. 특히 알고리즘의 이론적 성능을 평가하는 벤치마크를 넘어, 실제 환경에서의 로봇 성능을 종합적으로 검증하는 ‘챌린지’ 형식의 행사가 주목받는 것은 이러한 흐름을 명확히 반영한다. 연구자들이 실험실의 안락함을 벗어나 현실 세계의 복잡성과 불확실성을 직접 마주하기 시작했다는 것은, 1장에서 논의된 산업계의 구체적인 투자 동향과도 밀접하게 연결되는 지점이다.

4. IROS 2021 수상 논문 심층 분석: 기술적 최전선의 성과들

IROS 2021 학회에서 수여된 각종 수상 논문들은 2021년 9월 당시 로봇 공학 연구가 도달한 기술적 정점을 보여주는 가장 중요한 지표이다. 이 논문들은 단순히 새로운 알고리즘을 제안하는 것을 넘어, 로봇이 현실 세계와 상호작용하는 방식에 대한 근본적인 질문을 던지고 혁신적인 해결책을 제시했다. 본 장에서는 최우수 논문상(Best Paper Award), 농업 로봇 최우수 논문상(Best Paper on Agri-Robotics), 그리고 엔터테인먼트 및 어뮤즈먼트 최우수 논문상(Best Entertainment and Amusement Paper Award)을 수상한 세 편의 연구를 중심으로, 각 연구가 가진 독창적인 기술적 혁신성과 잠재적 파급 효과를 심층적으로 분석한다.

아래 표는 IROS 2021의 주요 수상 논문들을 압축적으로 요약한 것이다. 이 표를 통해 각 연구의 핵심적인 기여와 주요 응용 분야를 빠르게 파악하고, 이어지는 상세 분석의 전체적인 맥락을 사전에 이해할 수 있다.

테이블 2: IROS 2021 주요 수상 논문 요약

수상 부문논문 제목저자/소속핵심 기술/기여관련 자료
Best Paper AwardExtended Tactile Perception: Vibration Sensing through Tools and Grasped ObjectsHarold Soh 등 / 싱가포르 국립대학(NUS)뉴로모픽 동적 촉각 센서, 미세 진동 신호 해석을 위한 기계학습 프레임워크11
Best Paper on Agri-RoboticsA Robust Illumination-Invariant Camera System for Agricultural ApplicationsAbhisesh Silwal 등 / 카네기 멜런 대학(CMU)능동 조명(Active Lighting) 기반 스테레오 카메라, 조명 변화에 강건한 이미지 획득2
Best Entertainment and Amusement Paper AwardCollaborative Storytelling with Social RobotsEric Nichols 등 / 혼다 연구소(Honda Research Institute)대규모 신경망 언어 모델(LLM) 기반 협력적 스토리 생성, 소셜 로봇 ‘Haru’15

4.1 최우수 논문상: 확장된 촉각 인지 (Extended Tactile Perception)

4.1.1 연구 배경

인간은 눈을 감고 포크로 음식을 찍거나 손에 쥔 막대 끝에 무언가 닿았을 때, 그 접촉의 느낌과 위치를 손을 통해 인지할 수 있다. 이는 감각이 신체의 경계를 넘어 도구로까지 확장되는 놀라운 능력이다. 싱가포르 국립대학(NUS)의 Harold Soh 교수 연구팀은 로봇에게도 이러한 ‘확장된 촉각 인지(Extended Tactile Perception)’ 능력을 부여하고자 했다.11 이 연구는 로봇이 단순히 손가락 끝에 장착된 센서로 접촉을 감지하는 기존의 패러다임을 넘어, 잡고 있는 물체 전체를 자신의 감각 기관처럼 활용하여 세상과 상호작용하는 새로운 가능성을 제시했다.

4.1.2 핵심 기술

연구의 핵심은 두 가지 요소의 결합에 있다. 첫째는 4kHz의 높은 샘플링 속도로 미세한 진동을 감지할 수 있는 새로운 뉴로모픽 동적 촉각 센서 ’NUSkin’의 제안이다.19 인간의 피부에 있는 기계수용체(mechanoreceptor)에서 영감을 받은 이 센서는 도구를 통해 전달되는 미세한 진동 신호를 포착하는 역할을 한다. 둘째는 이 센서로부터 실시간으로 쏟아지는 방대한 진동 신호 데이터를 해석하기 위한 정교한 기계학습 프레임워크이다.11 연구팀은 획득된 신호로부터 스파이크 카운트(Spike Counts), 고속 푸리에 변환(FFT) 등 다양한 특징을 추출하고, 이를 Support Vector Machine(SVM), 다층 퍼셉트론(MLP), 순환 신경망(RNN)과 같은 여러 기계학습 모델에 입력하여 접촉의 종류와 위치를 추론하는 방식을 개발했다.18

4.1.3 실험 결과 및 기술적 의의

연구팀은 실험을 통해 제안된 시스템의 놀라운 성능을 입증했다. 로봇이 20cm 길이의 아크릴 막대를 잡고 있을 때, 막대의 임의의 지점에서 발생한 접촉 위치를 평균 1cm 미만의 오차로 정확하게 감지해냈다.19 또한, 인간과 로봇이 물체를 주고받는 상황에서 파지(grasp)의 안정성을 예측하거나, 로봇이 쥔 포크를 통해 접촉한 음식의 종류(예: 사과, 마시멜로)를 높은 정확도로 분류하는 데 성공했다.11 이 연구는 로봇 인지 분야에서 오랫동안 지배적이었던 시각 정보에 대한 의존도를 낮추고, 그동안 제한적으로만 활용되던 촉각 정보의 활용 범위를 획기적으로 넓혔다는 점에서 매우 큰 기술적 의의를 갖는다. 이는 향후 수술 로봇, 조리 로봇, 물체 조작 로봇 등 정교한 상호작용이 요구되는 다양한 분야에 큰 영향을 미칠 것으로 전망된다.

4.2 농업 로봇 최우수 논문상: 조명 불변 카메라 시스템

4.2.1 문제 정의

농업 환경은 로봇 기술을 적용하기에 가장 까다로운 비정형 환경 중 하나이다. 특히 시시각각 변하는 태양광의 세기와 방향, 구름에 의한 그림자, 식물 캐노피 내부의 복잡한 빛 반사 등은 컴퓨터 비전 시스템의 성능을 저하시키는 주된 요인으로 작용한다.14 이러한 조명 변화는 이미지 데이터의 일관성을 심각하게 해치며, 이는 결국 과일 탐지나 질병 진단 등을 위한 딥러닝 모델을 학습시키는 데 방대한 양의 다양한 조명 조건 하의 데이터를 요구하게 만들어 기술의 상용화를 가로막는 큰 장벽이 되어왔다.

4.2.2 기술적 해결책

카네기 멜런 대학(CMU)의 Abhisesh Silwal 연구팀은 이러한 문제를 해결하기 위해 ’능동 조명(Active Lighting)’이라는 독창적인 접근법을 제시했다.2 이들이 제안한 시스템은 고출력 LED 플래시를 카메라의 셔터와 정밀하게 동기화하여, 이미지 촬영 순간에만 강력하고 일관된 빛을 피사체에 조사하는 방식이다. 이를 통해 외부의 자연광 조건 변화에 거의 영향을 받지 않고, 항상 일관된 색상과 밝기를 가진 고품질의 이미지를 획득할 수 있다.

테이블 3: 조명 불변 카메라 시스템 하드웨어 제원

이 시스템의 구체적인 하드웨어 사양은 연구의 재현성과 기술적 깊이를 보여준다. 아래 표는 논문에 명시된 시스템의 핵심 제원을 정리한 것이다.14

하드웨어제원
카메라PointGrey CM3, 3.2 MP, Color, global shutter
렌즈3.5mm f/2.4, 89° x 73.8° x 101.7° FoV
플래시100W 측면 LED x6, 500W 중앙 LED x1 (5600K 색온도)
셔터 속도최저 11 µs
획득 속도1 ~ 20 Hz 동기화 스테레오

4.2.3 실험 결과 분석

연구팀은 극심한 조명 변화 조건 하에서 자신들의 시스템으로 획득한 ‘능동 조명(Active Light)’ 이미지와 일반 카메라로 촬영한 ‘자연광(Natural Light)’ 이미지를 사용하여 각각 객체 탐지 딥러닝 모델을 학습시키고 그 성능을 비교했다. 결과는 놀라웠다. 능동 조명으로 촬영한 일관된 품질의 이미지로 학습한 모델은, 다양한 조명 조건이 섞인 자연광 이미지로 학습한 모델에 비해 약 4분의 1에 불과한 데이터만으로도 유사한 수준의 정확도를 달성했다.14 이는 고품질의 일관된 데이터가 딥러닝 모델의 학습 효율을 극적으로 향상시킬 수 있음을 실증적으로 보여준 결과이다. 이 연구는 농업 로봇 분야에서 가장 큰 난제 중 하나였던 데이터 수집 및 레이블링 비용을 획기적으로 절감하고, 기술의 상용화를 앞당길 수 있는 매우 실용적이고 강력한 해결책을 제시했다는 점에서 높은 평가를 받았다.

4.3 엔터테인먼트 최우수 논문상: 소셜 로봇과의 협력적 스토리텔링

4.3.1 연구 개요

혼다 연구소(Honda Research Institute)의 Eric Nichols 연구팀은 인간과 로봇의 상호작용에 대한 새로운 지평을 열었다. 이들은 자신들이 개발한 소셜 로봇 ’하루(Haru)’가 사용자와 함께 대화하며 하나의 이야기를 공동으로 창작해나가는 ‘협력적 스토리텔링(Collaborative Storytelling)’ 시스템을 개발했다.15 이 시스템은 로봇이 단순히 프로그램된 정보를 일방적으로 전달하거나 정해진 질문에 답하는 수동적인 역할을 넘어, 사용자와 동등한 파트너로서 창의적인 결과물을 함께 만들어가는 새로운 형태의 HRI(Human-Robot Interaction)를 제안했다는 점에서 주목받았다.

4.3.2 핵심 방법론

이 시스템의 지능적인 상호작용 능력의 핵심에는 대규모 신경망 언어 모델(Large-scale Neural Language Models), 즉 LLM이 자리 잡고 있다.15 로봇 ’하루’는 LLM을 활용하여 사용자가 제시한 이야기의 문맥을 깊이 이해하고, 그에 어울리는 다음 문장을 자연스럽게 생성해낸다. 이를 통해 사용자와 로봇이 서로의 아이디어를 주고받으며 이야기가 유기적으로 발전해나가는, 마치 인간과 인간이 협력하는 듯한 창작 활동을 가능하게 한다.

4.3.3 사용자 참여도 증진 전략 및 연구의 시사점

연구의 궁극적인 목표는 기술적 구현을 넘어, 로봇과의 상호작용을 통해 사용자의 창의성과 참여도, 그리고 몰입감을 극대화하는 데 있다.16 로봇이 사용자의 이야기에 공감하고 예상치 못한 아이디어를 제시함으로써, 사용자는 더욱 깊이 이야기에 몰입하게 되고 창작의 즐거움을 느끼게 된다. 이 연구는 엔터테인먼트 분야뿐만 아니라, 아동 교육, 노인 돌봄, 심리 치료 등 인간과의 깊은 정서적 교감이 요구되는 다양한 분야에서 소셜 로봇이 수행할 수 있는 역할과 그 무한한 가능성을 보여주는 중요한 사례이다.

이 세 편의 수상 논문은 서로 다른 분야를 다루고 있지만, 공통적으로 로봇 기술의 발전 방향에 대한 중요한 단서를 제공한다. 첫째, 로봇의 인지 능력이 단일 감각의 최적화를 넘어 여러 감각을 유기적으로 통합하고(Multi-modal), 기존 감각의 물리적 한계를 뛰어넘는(Extended Perception) 방향으로 진화하고 있음을 보여준다. 농업 로봇이 능동 조명을 통해 ‘보는’ 행위의 불확실성을 제거했다면, 촉각 로봇은 도구를 통해 ‘만지는’ 행위의 범위를 확장했다. 이는 미래의 로봇이 보고, 듣고, 만지는 정보를 복합적으로 해석하여 인간을 뛰어넘는 수준의 상황 인지 능력을 갖추게 될 것임을 예고한다.

둘째, 정교한 AI 모델과 특화된 로봇 하드웨어의 심층적인 결합(Deep Integration)이 필수적이라는 점이다. 세 논문 모두 최신 AI/기계학습 모델과 그 모델의 성능을 극대화하기 위해 특별히 설계된 하드웨어의 긴밀한 결합을 특징으로 한다. 이는 더 이상 소프트웨어와 하드웨어를 분리하여 개발하는 방식이 유효하지 않으며, AI 모델의 요구사항을 하드웨어 설계 단계부터 반영하고, 역으로 하드웨어의 물리적 특성을 AI 모델이 최대한 활용하는 ‘AI-Hardware Co-design’ 패러다임이 로봇 공학의 핵심적인 발전 동력이 될 것임을 명확히 보여준다.

5. arXiv 제출 주요 신규 연구: 미래를 여는 선도적 아이디어

정식 학술대회 발표와 더불어, 연구자들이 최신 아이디어를 신속하게 공유하는 사전 공개 플랫폼인 arXiv에는 2021년 9월에도 향후 AI 및 로봇 연구의 방향성에 지대한 영향을 미칠 선도적인 연구들이 다수 공개되었다. 이 시기에 제출된 논문들은 특히 기술의 성능을 높이는 것을 넘어, 그 기술을 어떻게 더 안전하고 효율적으로 만들 것인가에 대한 깊은 고민을 담고 있었다. 본 장에서는 그중에서도 AI 기술의 사회적 책임과 직결되는 ’안전성(Safety)’과, 실제 환경에서의 데이터 활용 효율성을 극대화하는 ’학습 효율성(Learning Efficiency)’이라는 두 가지 핵심 주제를 다룬 논문들을 집중적으로 분석한다.21

5.1 머신러닝 안전성의 미해결 과제 (Unsolved Problems in ML Safety)

5.1.1 연구의 필요성 및 동기

Dan Hendrycks와 구글, OpenAI의 동료 연구자들이 발표한 이 포지션 페이퍼는 2021년 9월 AI 커뮤니티에 던져진 가장 중요한 화두 중 하나였다. 이 논문은 자율주행차, 의료 진단 등 인명과 직결된 고위험(high-stakes) 분야에 머신러닝(ML) 시스템의 적용이 확대됨에 따라, ’안전성’이 더 이상 부가적인 고려사항이 아닌 AI 연구의 최우선 순위가 되어야 함을 강력하게 역설했다.25 기존의 연구가 주로 모델의 정확도를 높이는 데 집중했다면, 이 논문은 모델이 예측하지 못한 상황에서 어떻게 실패할 수 있는지, 그리고 그 실패를 어떻게 방지할 수 있는지에 대한 체계적인 연구 로드맵을 최초로 제시했다는 점에서 큰 의미를 갖는다.

5.1.2 4대 핵심 연구 분야 분석

논문은 복잡하고 방대한 ML 안전성 문제를 해결하기 위한 네 가지 핵심 연구 분야를 명확하게 정의하고, 각 분야에서 해결해야 할 구체적인 연구 방향을 제시했다.25

  • 강건성 (Robustness): 이 분야는 모델이 학습 데이터에서 보지 못했던 이례적인 상황이나 ’블랙 스완’과 같은 극단적인 이벤트, 혹은 의도적인 적대적 공격(adversarial attacks)에 직면했을 때에도 안정적으로 동작하고 치명적인 오류를 일으키지 않도록 만드는 것을 목표로 한다.

  • 모니터링 (Monitoring): 모델이 배포된 이후, 그 예측과 행동을 지속적으로 감시하여 오작동의 징후를 조기에 발견하고, 개발 과정에서 의도치 않게 학습된 잠재적 위험 행동이나 악의적인 사용을 탐지하는 기술을 개발하는 분야이다.

  • 정렬 (Alignment): ‘정직’, ’공정함’과 같이 수식으로 명확하게 정의하기 어려운 추상적인 인간의 가치와 의도를 ML 모델이 올바르게 이해하고, 그 가치에 부합하는 방향으로 행동하도록 설계하는 근본적인 문제를 다룬다. 이는 ’AI 윤리’를 기술적으로 구현하려는 시도이다.

  • 시스템 안전성 (Systemic Safety): ML 모델 자체의 문제를 넘어, 모델이 운영되는 전체 시스템의 안전성을 다룬다. 예를 들어, ML 시스템을 대상으로 한 사이버 공격을 방어하거나, 여러 AI 에이전트 간의 상호작용이 예기치 못한 시스템 전체의 붕괴로 이어지는 것을 방지하는 연구 등이 여기에 포함된다.

5.2 오프라인 인간 시연 데이터 기반 로봇 조작 학습의 핵심 요소 (What Matters in Learning from Offline Human Demonstrations for Robot Manipulation)

5.2.1 연구 개요

스탠퍼드 대학의 Ajay Mandlekar 등이 발표한 이 연구는 로봇 학습 분야의 오랜 난제 중 하나인 ‘데이터 효율성’ 문제를 정면으로 다루었다.21 로봇이 새로운 기술을 배우기 위해 수많은 시행착오를 거치는 강화학습 방식은 시간과 비용이 많이 들고 위험할 수 있다. 이에 대한 대안으로, 사람이 원격으로 조종하며 보여준 시연 데이터(demonstration)를 로봇이 모방하여 학습하는 방식이 주목받고 있다. 이 연구는 특히, 추가적인 환경과의 상호작용 없이 사전에 수집된 ’오프라인 데이터’만으로 로봇이 얼마나 효과적으로 조작 기술을 학습할 수 있는지, 그리고 성공적인 학습을 위해 무엇이 중요한지를 체계적으로 분석했다.30 이를 위해 연구팀은 6개의 대표적인 오프라인 학습 알고리즘을 5개의 시뮬레이션 환경과 3개의 실제 로봇 작업에 적용하여 방대한 비교 실험을 수행했다.

5.2.2 주요 발견 및 시사점

이 광범위한 연구를 통해 도출된 발견들은 오프라인 로봇 학습 분야에 중요한 지침을 제공했다.

  • 시간적 추상화의 중요성: 인간의 행동은 단순히 현재의 시각적 상태에만 의존하지 않고, 이전 행동의 맥락과 미래의 목표를 고려하는 비-마코프적(non-Markovian) 특성을 가진다. 연구 결과, 이러한 시간적 맥락을 모델링할 수 있는 순환 신경망(RNN) 기반의 모방학습(Behavioral Cloning with RNN)이 다른 복잡한 알고리즘들보다 월등히 뛰어난 성능을 보였다.30 이는 로봇이 인간의 의도를 제대로 학습하기 위해서는 시간의 흐름에 따른 연속적인 정보를 이해하는 능력이 필수적임을 시사한다.

  • 배치 강화학습의 한계: 이론적으로는 데이터로부터 최적의 정책을 찾아낼 수 있을 것으로 기대되었던 당시의 최신 배치 강화학습(Batch RL) 알고리즘들은, 실제 인간이 시연한 불완전하고 다양한 품질의 데이터로부터는 안정적으로 학습하는 데 상당한 어려움을 겪는 것으로 나타났다.30 이는 오프라인 데이터의 분포와 학습 중인 정책의 분포가 달라지면서 발생하는 ‘분포 이동(distribution shift)’ 문제를 해결하는 것이 여전히 큰 도전 과제임을 보여준다.

  • 시뮬레이션의 가치: 이 연구의 또 다른 중요한 기여는 시뮬레이션 환경에서 얻은 통찰과 최적화된 하이퍼파라미터가 실제 로봇 환경에도 거의 그대로 적용되어 높은 성능을 발휘한다는 것을 입증한 점이다.30 이는 시간과 비용이 많이 드는 실제 로봇 실험을 최소화하고, 가상 환경에서 대부분의 연구 개발을 진행할 수 있는 가능성을 열어주어 로봇 학습 연구의 가속화에 크게 기여할 수 있다.

5.3 주목할 만한 기타 연구

5.3.1 시연으로부터 행동 트리(Behavior Tree) 학습

인간의 시연으로부터 로봇의 복잡한 행동 정책을 보다 직관적이고 모듈화된 형태로 학습하는 새로운 방법론이 제시되었다. 이 연구는 로봇의 행동을 ’조건’과 ’행동’의 조합으로 구성된 트리 구조, 즉 행동 트리(Behavior Tree, BT)로 표현하고, 이를 인간의 시연으로부터 자동으로 생성하는 방법을 제안했다.31 이는 복잡한 작업 순서와 예외 처리 조건을 개발자가 일일이 코딩하지 않고도 로봇에게 가르칠 수 있는 새로운 프로그래밍 패러다임을 제시한다.

5.3.2 다중 에이전트 시스템(MAS)을 이용한 자율 이동 로봇 협응

공장이나 물류 창고와 같이 여러 대의 로봇이 협력해야 하는 환경에서, 개별 로봇의 지능을 넘어 분산된 시스템 전체의 효율성을 최적화하는 연구도 발표되었다. 이 연구는 다중 에이전트 시스템(Multi-Agent System, MAS) 프레임워크를 이용하여 여러 대의 자율 이동 로봇(AMR)이 충돌 없이 효율적으로 물류 운송 작업을 수행하도록 협응하는 시스템을 제안했다.32 이는 미래의 스마트 팩토리나 자동화된 물류 시스템에서 필수적인 군집 지능(swarm intelligence) 기술의 중요성을 보여준다.

이 시기 arXiv에 발표된 연구들은 AI 연구의 패러다임이 중요한 전환점에 있음을 명확히 보여준다. ‘ML 안전성’ 논문이 강건성, 모니터링, 정렬 등 ‘실패하지 않는’ 시스템을 만드는 문제를 정면으로 다루고, ‘오프라인 학습’ 논문이 불완전한 실제 데이터로부터 ‘안정적으로’ 학습하는 방법을 탐구한 것은, AI 기술이 실험실 수준의 벤치마크에서 높은 점수를 획득하는 단계를 넘어, 예측 불가능하고 불완전한 현실 세계에서 신뢰할 수 있게 동작해야 한다는 공통된 문제의식을 공유한다. 이는 AI 연구의 무게 중심이 ‘최고 성능(State-of-the-art Performance)’ 달성에서 ‘신뢰할 수 있는 시스템(Trustworthy AI)’ 구축으로 이동하고 있음을 보여주는 결정적인 증거이다.

또한, ‘오프라인 학습’ 연구가 단순히 더 많은 데이터를 사용하는 것을 넘어, 다양한 품질의 데이터가 섞여 있을 때 각기 다른 학습 알고리즘이 어떻게 반응하는지를 세밀하게 분석한 것은 데이터의 양뿐만 아니라 ’질’과 ’이질성’이 학습 결과에 미치는 영향에 대한 깊은 고찰이 시작되었음을 의미한다. 이는 향후 로봇 학습 연구가 단순히 새로운 알고리즘을 제안하는 것을 넘어, 현실 세계에서 수집될 수밖에 없는 ’불완전한 데이터’의 특성을 깊이 이해하고 이를 효과적으로 다룰 수 있는 방법론으로 심화될 것임을 예고한다. 이는 ‘데이터 중심 AI(Data-centric AI)’ 철학이 로봇 공학 분야에도 본격적으로 적용되기 시작했음을 알리는 신호탄이라 할 수 있다.

6. 결론 및 전망

2021년 9월은 인공지능과 로봇 기술이 이론적 탐구와 성능 경쟁의 시대를 지나, 국가 전략의 핵심으로 부상하고 산업계의 지각 변동을 주도하며, 동시에 기술의 내실을 다지는 중요한 연구들이 결실을 맺은 시기였다. 본 보고서에서 심층적으로 분석한 바와 같이, 이 시기의 기술 동향은 몇 가지 핵심적인 키워드로 요약될 수 있다. 첫째, 실세계 적용을 위한 강건성 확보이다. 농업 환경의 조명 변화를 극복하려는 시도 2나, AI 시스템의 근본적인 안전성을 확보하려는 노력 25은 기술이 실험실을 벗어나 예측 불가능한 현실 세계에서 신뢰성을 갖추기 위한 필수적인 과정임을 보여준다. 둘째,

인간과의 자연스러운 상호작용이다. 소셜 로봇과의 협력적 스토리텔링 15이나 도구를 통한 확장된 촉각 인지 11 연구는 로봇이 더 이상 단순한 도구가 아닌, 인간과 교감하고 협력하는 파트너로 진화하고 있음을 시사한다. 셋째,

데이터로부터의 효율적인 학습이다. 불완전한 인간의 시연 데이터로부터 안정적으로 학습하는 방법을 탐구한 연구 21는 방대한 데이터 속에서 어떻게 유의미한 지식을 효율적으로 추출할 것인가에 대한 깊은 고민을 담고 있다.

본 보고서에서 분석한 2021년 9월의 연구 동향들은 향후 AI 및 로봇 기술이 나아갈 방향을 명확하게 제시하고 있다. 로봇은 시각, 청각, 촉각 등 더욱 다양한 감각 정보를 유기적으로 융합하여 복잡한 환경을 이전보다 훨씬 정교하게 인지하게 될 것이다. 거대 언어 모델과 같은 파운데이션 모델의 발전은 로봇이 인간의 언어와 의도를 더 깊이 있게 이해하고, 이를 바탕으로 소통하고 협력하는 능력을 비약적으로 향상시킬 것이다. 동시에, 기술이 사회에 미치는 영향력이 커질수록 그에 상응하는 안전성과 신뢰성을 확보하기 위한 기술적, 제도적 연구의 중요성은 아무리 강조해도 지나치지 않을 것이다.

결론적으로, 2021년 9월의 동향은 미래 AI 및 로봇 공학이 풀어야 할 핵심적인 연구 과제들을 남겼다. 첫째, 데이터 중심의 학습 패러다임 심화이다. 단순히 알고리즘을 개선하는 것을 넘어, 현실 세계의 불완전하고 편향된 데이터를 어떻게 정제하고 효과적으로 활용할 것인가가 핵심 경쟁력이 될 것이다. 둘째, 다중 감각 정보의 융합 및 해석이다. 개별 센서의 성능을 넘어, 여러 감각 정보를 통합하여 인간 수준 혹은 그 이상의 종합적인 상황 판단 능력을 구현하는 것이 중요한 도전 과제로 남는다. 셋째, 신뢰할 수 있고 안전한 AI 시스템 설계이다. 기술의 성능이 고도화될수록, 예기치 못한 실패가 가져올 위험 또한 커지므로, 시스템의 모든 단계에서 안전성을 검증하고 보장하는 방법론 연구가 시급하다. 마지막으로, 인간-로봇 상호작용의 사회적 수용성 확보이다. 기술이 사회에 성공적으로 통합되기 위해서는 기술적 완성도뿐만 아니라, 인간 사용자가 로봇을 신뢰하고 편안하게 상호작용할 수 있도록 만드는 인간 중심의 설계 철학이 더욱 중요해질 것이다. 이러한 과제들을 해결해 나가는 과정이 곧 미래 AI 및 로봇 기술의 역사를 만들어 나갈 것이다.

7. 참고 자료

  1. 두나무X네이버 원팀 동맹…글로벌 AI 시장 출사표 - 뉴스토마토, https://www.newstomato.com/ReadNews.aspx?no=1277070
  2. Congratulations to the authors! IROS 2021 just wrapped up and RI …, https://www.ri.cmu.edu/congratulations-to-the-authors-iros-2021-just-wrapped-up-and-ri-did-well/
  3. 중국 의료용 로봇 시장 트렌드 - 한국보건산업진흥원, https://www.khidi.or.kr/board/view?linkId=48873844&menuId=MENU01523
  4. 신뢰성 있는 고성능 인공지능 기술 확산을 위한 전략 - 월간 통상, https://tongsangnews.kr/webzine/1532312/special_4.html
  5. 2021 AI 이슈, 융합·확장·신뢰·지속가능 키워드 두드러져 - 사이언스타임즈, https://www.sciencetimes.co.kr/news/2021-ai-%EC%9D%B4%EC%8A%88-%EC%9C%B5%ED%95%A9%C2%B7%ED%99%95%EC%9E%A5%C2%B7%EC%8B%A0%EB%A2%B0%C2%B7%EC%A7%80%EC%86%8D%EA%B0%80%EB%8A%A5-%ED%82%A4%EC%9B%8C%EB%93%9C-%EB%91%90%EB%93%9C%EB%9F%AC/
  6. BRL Conferences 2021 - Bristol Robotics Laboratory, https://www.bristolroboticslab.com/2021-Conferences
  7. Technology and robotics events in 2021 - Leo Rover, https://www.leorover.tech/post/technology-and-robotics-events-in-2021
  8. IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2021, Prague, Czech Republic, September 27 - Researchr, https://researchr.org/publication/iros-2021
  9. 2nd Korea Artificial Intelligence Conference - 한국인공지능학술대회, https://2021.koreaai.org/
  10. dectrfov/IROS2021PaperList: IROS 2021 paper list - GitHub, https://github.com/dectrfov/IROS2021PaperList
  11. Assistant Professor Harold Soh and collaborators win Best Paper Award at IROS 2021, https://www.comp.nus.edu.sg/news/2021-best-paper-iros/
  12. 2021 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) Best Paper Award - iHealthtech – Institute for Health Innovation & Technology, https://ihealthtech.nus.edu.sg/2021-ieee-rsj-international-conference-on-intelligent-robots-and-systems-iros-best-paper-award/
  13. George A. Kantor - News - Carnegie Mellon University, https://www.cmu.edu/news/experts/georgea.kantor
  14. A Robust Illumination-Invariant Camera System for Agricultural …, https://par.nsf.gov/servlets/purl/10311421
  15. IROS 2021 Best Entertainment and Amusement Paper Award | Honda Research Institute Japan Co., Ltd., https://www.jp.honda-ri.com/en/information/915/20211004/
  16. (PDF) Let’s listen and tell a story together: social robot and multidimensional learning engagement among young learners - ResearchGate, https://www.researchgate.net/publication/390764222_Let’s_listen_and_tell_a_story_together_social_robot_and_multidimensional_learning_engagement_among_young_learners
  17. A Storytelling Robot for People with Dementia - TU Delft Repository, https://repository.tudelft.nl/file/File_5ce1182a-bdc1-4a0d-99fe-6841cef4ab16
  18. Extended Tactile Perception | Tasbolat Taunyazov, https://tasbolat.com/projects/extense/
  19. publications - Tasbolat Taunyazov, https://tasbolat.com/publications/
  20. Honda Research Institute Japan Co., Ltd., https://www.jp.honda-ri.com/en/
  21. What Matters in Learning from Offline Human Demonstrations for Robot Manipulation - arXiv, https://arxiv.org/abs/2108.03298
  22. Robotics Sep 2021 - arXiv, http://arxiv.org/list/cs.RO/2021-09?skip=250&show=100
  23. Robotics Sep 2021 - arXiv, http://arxiv.org/list/cs.RO/2021-09?skip=575&show=50
  24. [2109.01517] A brief history of AI: how to prevent another winter (a critical review) - arXiv, https://arxiv.org/abs/2109.01517
  25. Unsolved Problems in ML Safety - arXiv, https://arxiv.org/abs/2109.13916
  26. arxiv.org, https://arxiv.org/pdf/2109.13916#:~:text=We%20present%20four%20problems%20ready,(%E2%80%9CSystemic%20Safety%E2%80%9D).
  27. Unsolved Problems in ML Safety - arXiv, https://arxiv.org/pdf/2109.13916
  28. Unsolved Problems in ML Safety - Regulations.gov, https://downloads.regulations.gov/NIST-2021-0004-0105/attachment_1.pdf
  29. Ajay Mandlekar - Stanford AI Lab, https://ai.stanford.edu/~amandlek/assets/resume/Resume.pdf
  30. What Matters in Learning from Offline Human Demonstrations for …, https://proceedings.mlr.press/v164/mandlekar22a/mandlekar22a.pdf
  31. Combining Context Awareness and Planning to Learn Behavior Trees from Demonstration - arXiv, https://arxiv.org/pdf/2109.07133
  32. arXiv:2109.12386v1 [cs.RO] 25 Sep 2021, https://arxiv.org/pdf/2109.12386